查看原文
其他

蒋勇:法律人工智能,我们能做什么?

2017-10-16 律新社


律新社 | 编辑部出品


编者按:本文根据无讼创始人、天同律师事务所主任蒋勇律师在2017第二届中国新兴法律服务产业高峰论坛上的演讲整理,由蒋勇律师本人修订。高峰论坛由上海市法学会、华东政法大学、律新社共同主办,被誉为法律服务产业的“G20”峰会。更多精彩分享及视频专访,律新社将陆续发布,敬请期待。


无讼创始人、天同律师事务所主任 蒋勇


今天的主题第一个就是新智能,我想就这个话题跟大家谈一下这一年来我的一些思考。


去年第一届高峰论坛是9月4号,之后的10月15号,我们参加了阿里巴巴2016年的云栖大会,发布了中国第一个法律人工智能机器人“法小淘”,到今天正好是一周岁。


“人工智能”这四个字写出来非常轻松,但是当它真正用到法律场景的时候,我们需要克服的困难非常多。


那么,法律的人工智能我们到底能做什么?在去年的云栖大会上,阿里巴巴技术委员会主席王坚说,新的技术进步归纳起来其实就是三句话:


  • 互联网成为了基础设施

  • 大数据成为了生产资料

  • 云计算成为了公共服务


这三项新的技术到底对我们产生的影响到底是什么,我用特别简练的话跟大家分享。


第一个是互联网。有人说移动互联网才是真正的互联网,过去我们在PC端的时候其实不是真正的互联网,因为人一离开电脑就不在网上了。但是今天是真正的互联网,因为我们每个人手上拿着手机,它可以使我们无时无刻不在线,让万物互联。


连接会带来资源的重新配置,因为如果没有无时无刻的在线和连接,事实上我们过去很多脑子里面想的事情是做不成的。比如非常典型的就是滴滴,我们的手机如何才能跟一个正在附近行驶的出租车司机连接起来,就是因为我们时时刻刻都在移动互联网上,并且我们时时刻刻都把我们的位置数据,出租车司机时时刻刻把他的位置数据上传到网上,你的需求数据和他的位置数据关联起来,闲置的资源直接来进行重新的配置。



第二个是大数据。实际上一切都是数据,但过去数据没有办法被采集。但是,有了移动互联网之后,因为人的所有行动在线上,所以人的所有行动都可以被数据化,这个时候这些数据被采集以后就有用了,所以数据的全面性是大数据的一个非常重要的要素。


我在法院和法官们交流的时候常常说这么一句话:很多法官认为现在在线上做工作,比如说要线上公开裁判文书、参与智慧法院建设的这些工作,是一件很麻烦的事情,但大家千万不要这么认识。不要把它仅仅当成一项工作,因为我们每一个法官的每一次敲击键盘的动作其实都是在产生数据,这些数据就是整个中国法院的大数据,也是全中国法律的大数据的构成部分,甚至我们可以把它看成是全世界法律智慧的汇集。


还有一点是数据的真实性,因为数据不会说谎。你如果在网上买了一个东西,这个记录数据传到线上之后,是不能被修改的。


还有就是数据的客观性,因为它会使律师的能力也可以被数据化,这是无讼早期一直在致力的一项工作。律师行业为什么经常会出现鱼龙混杂、无法评价的情况,因为我们没有办法把专业能力有形化,我们没有办法去展示专业能力。那怎么办?其实所有的专业能力是可以通过你的外在表现来进行数据化的,所以用数据是可以为律师画像的,那同样,其实用数据也是可以为法官、学者画像的。所有的数据实际上才是法律职业共同体构成的最底层问题和背后的逻辑。


所以,律师能力的数据如果被采集,就可以对数据进行重新的结构化重整,从而在线上实现跟需求的重新匹配,这就是为律师画像的数据的重要作用。


第三个是云计算。很多年前,国防科技大学建设了一台世界上运算速度最快的机器——银河-1号巨型计算机。运算的次数有一个单位叫cps,它1秒1亿次的cps当时已经是全球最快的运算速度。20多年过去,计算速度最快的计算机同样是在中国,就是天河2号,每秒运算速度是3.4亿亿次。现在手机的运算能力已经相当于NASA在1969年阿波罗计划人类登月的时候所拥有的全部计算能力,这就是摩尔定律所带来的让人吃惊的效果。


王坚博士提到的这三项新的技术,铺垫、催生了今天的人工智能。


人工智能在1955年达特矛斯会议的时候其实已经被提出,但是那么多年下来,其实人类经历了人工智能的一段热潮,然后冷下去,然后又一段热潮,又冷下去。这次人工智能的第三次热潮兴起,就是因为这三项技术的进步。


人工智能从它诞生之日起就一直有两个流派,第一个流派叫“鸟飞派”。大家一直都认为,所谓的人工智能是什么?就是让机器学会像人一样思考。机器怎样才能像人一样思考?人类在解决这些问题时一般都可以从自然界去寻找答案。人曾经想像鸟一样飞翔,所以给自己插上翅膀,然后跳下悬崖,结果大家都知道了。



但是人类飞起来了吗?


人类飞起来了。因为人类发现,其实我们可以利用空气动力学的原理造出飞机,并且实现商用。鸟飞派的一个观点就是认为让机器学会像人脑一样思考,一定要让机器像人脑的结构,所以他们会去对人脑进行非常精细的切片,然后在每一个小切片上去模拟人类大脑的计算能力。


但当科技进步到目前,我们发现其实并不一定要让机器模拟人脑的结构,而是可以采取让机器学习的方法,而机器学习靠的是数据驱动和超级计算。


因为有了移动互联网而使得数据无处不在,使得数据可以被采集,可以被用来分析。再加上有了云计算,我们的计算能力在以每年1.5倍到两倍的速度在提升。这两者结合,让今天的人工智能成为了可能。


AlphaGo战胜人类带来的刺激非常之大,但是我也想告诉大家,它根本不算什么。人工智能分三个大的阶段,第一个阶段是弱人工智能,第二个阶段叫强人工智能,第三个阶段叫超人工智能。而弱人工智能事实上已经在普遍在我们的生活当中实现,网络购物的关联推荐就是很好的例子。


无人驾驶技术已经非常成熟了,它的感应器可以实时感知环境的变化,这是一种感知的人工智能,但是它也只是弱人工智能。AlphaGo也只是弱人工智能,因为他只能下围棋,写法律文书它就不会。



法律人在人工智能的第三次浪潮中应该做些什么?


法律人真正要做的是一些基础性的工作,主要是两样——数据和算法。


第一是数据。数据有两个关键点——数量和质量。3500万份裁判文书已经在网上公开,并且还在以每天大概3到5万份的速度增长。全球每一天大概有几千万次对裁判文书网的访问,平均每一秒钟大概是1400多次。这个数据是不是听起来很大?但是放在大数据领域还是太小了,微不足道,跟我们的计算能力相比,这样的数据根本不算什么。


那怎么办?难道我们要再等一百年,等数据足够多了再去处理吗?事实上,其实数据量的积累可能有一个更快的办法,就是司法过程的全面公开。一份裁判文书最长的一百多页,但是一个案子的案卷可能堆积如山。一份裁判文书和整个司法过程的数据相比哪个更大?当然是司法过程。所以最高法院正在推动的司法过程公开对于中国的法律大数据的积累功不可没,将使得我们过去要用100年才能完成的数据积累过程,有可能在一年之内实现。


还有就是数据质量的提升。每位法官都很辛苦,但是,把数据的质量做得更好一点,不仅仅是对当前这份判决负责,对公平正义的历史负责,其实也是对整个中国的法律大数据的生成、世界的法律文明负责。因为数据越干净,越完整,越准确,对数据的处理会越顺利。


所以其实,每一个法律人的工作都跟数据的产生息息相关,全面推动法院和律师行业的信息化进程,推动法律人工作的在线化进程,是法律人工智能往下发展的最重要的工作。


第二是算法。我们说的机器的深度学习,其实就是建立相似模型,然后对它进行人工的、半人工的干预和训练,非常的累,非常的难。到今天,其实工具和技术都不是问题,钱也不是问题,难点在于技术在法律场景下的应用,尤其是在线的应用。


人工智能在感知和识别方面已经做得很不错,但是法律不一样,自然语言识别当中的法律语言如何识别,难度是最大的。


再有一个是分析的问题。我们很多人只要一想到人工智能,首先就想到一个机器人的一个形象,其实这是一个误会。具不具备机器人的形象不是人工智能的标志,因为那只是个硬件,真正的人工智能是背后的系统,而背后的系统又绝不仅仅是你问我答,那叫自动应答机,也不仅仅是检索,更不是一些资料收集汇总以后就能完成的事情。


真正的人工智能是什么?它要懂语言,它要懂语句的真实意思。汉语发展到今天这个阶段,或许会比英文的科技化难度更大。比如离婚案件当中有一个描述叫“与他人存在不正当关系”,首先这个词要被输入系统,然后进到算法库内,真正的人工智能最后输出结果是原来这叫“违反夫妻忠实义务”。


现在你的脑子当然能想得到,因为你是人,但是机器它做不到,如果能做到,法律的人工智能的春天就真的来了。

 

最后总结一下,人工智能对未来法律服务市场的影响到底会怎样?


示意图,非ppt原图


我自己最近一直使用这个象限图来看待法律服务和律师事务所,看待法律服务的整个市场。横轴是法律服务的性质,纵轴是参与处理案件的人员或者团队。右上的第一象限是个性化程度高,需要团队才能解决的一些法律服务,这是中国的顶级的律所或者一些优秀团队的领地。左下的第三象限是个人就能完成的、标准化程度高、客单量大的服务。人工智能会使得越来越多的个性化的事项可以被标准化,使得越来越多的需要团队才能完成的事情可以被个人完成,所以整个中轴点会向右上移动,第三象限(标准化+个人)越来越大,第一象限(个性化+团队)越来越小。


人工智能这么发展,并不是要抢占人类的地盘,而是逼得我们人类应该更像人一样去思考,让人不要去做机器做的事情。


这是我们一再说的一句话,人不要去做机器做的事情,人应该更有创造力,更有创造性,法律服务概莫能外。


去年我在律新社讲完之后,据说引起了法律服务创业者的一些讨论。大家觉得说我们干了这么久了,也还没有看到什么实质性的大的变化,我们到底要不要坚持,到底还要不要做所谓的法律科技?我们的未来到底在哪里?


这一年来大家讨论得很多,去年最后我也引用了特别流行的“未来已来”这样一些话,但我其实现在有更深刻的理解:


示意图,非ppt原图


人类的时间长河,我们可以想象这是新石器时代,可以想象这是1750年,这是2015年。这么漫长的历史进程,我们一直都在这里,但是我们有没有意识到,其实在这我们已经站在了这个地方。


人类一旦突破弱人工智能的局限,进入到强人工智能的领域,其实超人工智能就是必然的。


人类的科技进步有一个加速原理。前100年所有的科技进步其实在21世纪只用20年就完成了,而21世纪的20年的科技进步在未来是4年时间完成,而在未来要4年时间完成的事情,再往后其实只需要十个月。也就意味着,刚才我提到的这个3.4亿亿次的计算能力到达我们每个人的手机这么大小的一 53 28533 53 15288 0 0 2722 0 0:00:10 0:00:05 0:00:05 3050个设备的时间是什么时候?2025年。再过不到十年,我们每个人都可以用一千美元买到相当于天河2号计算能力的设备。


今天,每一个人都应该感到幸运,因为历史的长河这么长,你没有站在这里,你也没有站在这里,你今天居然站在这里。那当你站在这里的时候,你难道不认为自己应该做点什么吗?


谢谢!

 


更多精彩嘉宾演讲及视频专访,律新社将陆续发布,敬请期待~


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存